期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 低编译复杂度的双容错阵列码
解峥, 王子豪, 唐聃, 张航, 蔡红亮
《计算机应用》唯一官方网站    2023, 43 (9): 2766-2774.   DOI: 10.11772/j.issn.1001-9081.2022091344
摘要189)   HTML9)    PDF (2691KB)(61)    收藏

纠删码技术是独立磁盘冗余阵列-6(RAID-6)的双容错能力的底层实现技术,它的性能是左右RAID-6性能的重要因素。针对RAID-6中常用阵列纠删码的I/O不平衡和数据恢复速度慢的问题,提出一种基于异或(XOR)的混合阵列码——J码(J-code)。J-code采用新的校验生成规则,首先,利用原始数据构造的二维阵列计算出对角校验位并构造新的阵列;然后,利用新阵列中数据块之间的位置关系计算得到反对角校验位。此外,J-code将原始数据与部分校验位存储于同一磁盘,能减少编译码过程中的异或(XOR)操作次数和单盘恢复过程中读取数据块的个数,从而降低编译码复杂度和单盘故障修复的I/O成本,缓解磁盘热点集中现象。仿真实验结果表明,相较于RDP(Row-Diagonal Parity)、EaR(Endurance-aware RAID-6)等阵列码,J-code的编码时间减少了0.30%~28.70%,单磁盘故障和双磁盘故障的修复用时分别减少了2.23%~31.62%和0.39%~36.00%。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 分布式存储中基于局部修复码的负载均衡方法
龙运波, 唐聃
《计算机应用》唯一官方网站    2023, 43 (3): 767-775.   DOI: 10.11772/j.issn.1001-9081.2022010074
摘要283)   HTML9)    PDF (1831KB)(85)    收藏

针对分布式存储中热数据访问性能低下的问题,提出一种基于局部修复码(LRC)的负载均衡方法,采用编码的方式规避节点的集中式访问,并提高热数据的访问效率。首先,利用平衡不完全区组设计(BIBD)构造一类适用于小规模存储系统的特殊LRC,从而为编码数据提供多种访问方式;然后,分别基于里所(RS)码和随机阵列码将LRC推广到更大规模,并使它满足存储系统一定的容错需求;最后,提出一种热数据访问算法以降低热数据的访问压力,并结合合理的数据布局方案实现存储系统在高频访问场景下的负载均衡。理论分析和实验结果表明,所提方法能以极小的代价实现负载均衡,明显优于传统方法中利用多副本及最大距离可分(MDS)码实现的负载均衡方法,尤其是解决了因冷热数据访问不均带来的负载失衡问题,可以有效提高热数据存储系统的访问效率。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于隐私计算的网络会议数字评选系统设计方案
王腾腾, 崔喆, 唐聃
《计算机应用》唯一官方网站    2023, 43 (2): 450-457.   DOI: 10.11772/j.issn.1001-9081.2022010025
摘要298)   HTML15)    PDF (1992KB)(168)    收藏

针对目前网络会议数字评选系统无法做到既保证评审人意见的隐私性又获得安全可信的结果的问题,提出一种基于隐私计算的网络会议数字评选系统设计方案。首先,通过里所(RS)码的编码矩阵对评审数据进行秘密分享以得到秘密份额,并将每一方评审数据的哈希值作为存根交由主办方存档以防止抵赖;然后,通过编码矩阵之单调扩张矩阵对秘密份额进行协同计算以得出计票结果;最后,通过校验矩阵检查多方协同计算过程中是否有秘密份额的分享错误或篡改行为存在。理论分析与仿真实验表明,所提方案可在中小规模的网络会议数字评选系统中实现隐私计算功能。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 基于粗糙集理论的不完备数据分析方法的混合信息系统填补算法
彭莉, 张海清, 李代伟, 唐聃, 于曦, 何磊
计算机应用    2021, 41 (3): 677-685.   DOI: 10.11772/j.issn.1001-9081.2020060894
摘要406)      PDF (1135KB)(644)    收藏
为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数表达)、缺失型属性的混合信息系统(HIS)数据的填补能力,提出了一种基于粗糙集理论的混合信息系统缺失值填补方法(RSHISMIA)。首先,根据决策属性等价类划分思想并按照决策属性对混合信息系统HIS进行划分,解决了填补后可能出现的决策规则冲突问题;其次,定义混合距离矩阵来合理量化对象间的相似性,从而筛选出具有填补能力的样本并克服ROUSTIDA无法处理连续性属性的缺点;然后,结合近邻思想解决了ROUSTIDA在无差别对象属性值发生冲突情况下无法对相同属性缺失数据进行填补的问题。最后,使用10个UCI标准数据集进行实验,将所提出的方法与ROUSTIDA、K近邻填补(KNNI)算法、随机森林填补(RFI)算法和矩阵分解(MF)等几种经典算法进行了比较。实验结果表明,与ROUSTIDA相比,所提方法在查全率上平均高出81%,在查准率上提升了5%~53%,且其归一化均方根误差(NRMSE)最多减小了0.12。此外,所提方法的分类准确率与ROUSTIDA相比平均提升了7%,且优于KNNI、RFI及MF等填补算法。
参考文献 | 相关文章 | 多维度评价
5. 分布式存储系统中的低修复成本纠删码
张航, 刘善政, 唐聃, 蔡红亮
计算机应用    2020, 40 (10): 2942-2950.   DOI: 10.11772/j.issn.1001-9081.2020010127
摘要393)      PDF (1250KB)(929)    收藏
纠删码技术是分布式存储系统中典型的数据容错方法,与多副本技术相比,能够以较低的存储开销提供较高的数据可靠性;然而,纠删码修复成本过高的特点限制了其应用。针对现有纠删码修复成本高、编码复杂和灵活性差的问题,提出一种编码简单的低修复成本的纠删码——旋转分组修复码(RGRC)。RGRC首先将多个条带组合成条带集,然后利用条带之间的关联关系对条带集内的数据块进行分层旋转编码,以此得到相应的冗余块。RGRC大幅度地减少了单节点修复过程中所需要读取和传输的数据量,从而能节省大量的网络带宽资源。同时RGRC在解决单节点修复成本高的问题时,依然保留着较高的容错能力,且为满足分布式存储系统的不同需求,可以灵活地权衡系统的存储开销和修复成本。在分布式存储系统中进行的对比实验分析结果展示,与其他常用的RS(Reed-Solomon)码、LRC(Locally Repairable Codes)、basic-Pyramid、DLRC(Dynamic Local Reconstruction Codes)、pLRC(proactive Locally Repairable Codes)、GRC(Group Repairable Codes)、UFP-LRC(Unequal Failure Protection based Local Reconstruction Codes)相比,RGRC只需要增加少量的存储开销,就能降低单节点修复14%~61%的修复成本,同时减少14%~58%的修复时间。
参考文献 | 相关文章 | 多维度评价
6. 基于多斜率码链的阵列纠删码
唐聃, 杨昊澎, 王福超
计算机应用    2017, 37 (4): 936-940.   DOI: 10.11772/j.issn.1001-9081.2017.04.0936
摘要706)      PDF (854KB)(475)    收藏
针对当前大多阵列纠删码容错能力偏低以及构造时需要满足的约束条件较强的问题,提出一类基于码链构造的阵列纠删码。该阵列纠删码使用不同斜率码链组织数据元素和校验元素间的关系,从而能达到理论上不受限制的容错能力;而在构造时避开了类似素数约束的强约束条件,易于实用和扩展。仿真实验结果表明,相对于RS(Reed-Solomon)码,基于多斜率码链阵列纠删码在运算效率上的提升超过了2个数量级;在固定的容错能力下,存储效率能随着条块尺寸的增加而提高。此外,该类阵列码的修复代价和更新代价为一个固定常量,不会随着系统规模的扩大或容错能力的提高而增加。
参考文献 | 相关文章 | 多维度评价
7. 级联式低消耗大规模网页分类在线获取方法
王亚强, 汤铭, 曾沁, 唐聃, 舒红平
计算机应用    2017, 37 (4): 924-927.   DOI: 10.11772/j.issn.1001-9081.2017.04.0924
摘要537)      PDF (847KB)(537)    收藏
针对海量网页在线自动高效获取网页分类系统设计中如何更有效地平衡准确度与资源开销之间的矛盾问题,提出一种基于级联式分类器的网页分类方法。该方法利用级联策略,将在线与离线网页分类方法结合,各取所长。级联分类系统的一级分类采用在线分类方法,仅利用锚文本中网页标题包含的特征预测其分类,同时计算分类结果的置信度,分类结果的置信度由分类后验概率分布的信息熵度量。若置信度高于阈值(该阈值采用多目标粒子群优化算法预先计算取得),则触发二级分类器。二级分类器从下载的网页正文中提取特征,利用预先基于网页正文特征训练的分类器进行离线分类。结果表明,相对于单独的在线法和离线法,级联分类系统的 F1值分别提升了10.85%和4.57%,并且级联分类系统的效率比在线法未降低很多(30%左右),而比离线法的效率提升了约70%。级联式分类系统不仅具有更高的分类能力,而且显著地减少了分类的计算开销与带宽消耗。
参考文献 | 相关文章 | 多维度评价
8. 基于二维模运算的高效率可逆信息隐藏方案
李越 唐聃 孙敏钧 王燮 蔡红亮 曾琼
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023060900
预出版日期: 2023-10-31